Định lý giới hạn trung tâm Định_lý_giới_hạn_trung_tâm

Cho X1, X2... là tập hợp các biến ngẫu nhiên được định nghĩa trên cùng một không gian xác suất, có cùng phân phối D và độc lập lẫn nhau. Giả sử giá trị kỳ vọng μ {\displaystyle \mu } và độ lệch chuẩn σ {\displaystyle \sigma } của phân phối D là tồn tại và hữu hạn ( σ ≠ 0 {\displaystyle \sigma \neq 0} ).

Xét tổng Sn = X1 + ... + Xn.Ta có Sn có kỳ vọng là nμ và độ lệch chuẩn σ n½. Khi đó, phân phối của Sn hội tụ về phân phối chuẩn N(nμ,σ2n) khi n tiến về vô cùng.

Để làm rõ hơn sự hội tụ này, ta đặt:

Z n = S n − n μ σ n . {\displaystyle Z_{n}={\frac {S_{n}-n\mu }{\sigma {\sqrt {n}}}}.}

để có được kỳ vọng và độ lệch chuẩn của Z n {\displaystyle Z_{n}} lần lượt là 0 và 1.

Nếu phân phối của Zn hội tụ về phân phối chuẩn N(0,1) khi n tiến về vô cùng (tức là hội tụ theo phân phối), thì cũng có nghĩa là: nếu Φ là hàm phân phối tích lũy của N(0,1), thì với mọi số thực z:

lim n → ∞ P ( Z n ≤ z ) = Φ ( z ) , {\displaystyle \lim _{n\to \infty }{\mbox{P}}(Z_{n}\leq z)=\Phi (z),}

Hay một cách tương đương:

lim n → ∞ P ( X ¯ n − μ σ / n ≤ z ) = Φ ( z ) {\displaystyle \lim _{n\to \infty }{\mbox{P}}\left({\frac {{\overline {X}}_{n}-\mu }{\sigma /{\sqrt {n}}}}\leq z\right)=\Phi (z)}

trong đó

X ¯ n = S n / n = ( X 1 + ⋯ + X n ) / n {\displaystyle {\overline {X}}_{n}=S_{n}/n=(X_{1}+\cdots +X_{n})/n}

Chứng minh định lý giới hạn trung tâm

Mặc dù đây là định lý quan trọng trong thống kê và xác suất ứng dụng nhưng phần chứng minh của nó khá đơn giản bằng cách sử dụng các hàm đặc trưng, nó gần giống với phần chứng minh của luật số lớn.

Ta có với mọi i, Y i = X i − μ σ {\displaystyle Y_{i}={\frac {X_{i}-\mu }{\sigma }}} có kỳ vọng 0 và độ lệch chuẩn 1, với hàm đặc trưng được khai triển giới hạn dưới dạng:

φ Y i ( t ) = 1 − t 2 2 + o ( t 2 ) , t → 0. {\displaystyle \varphi _{Y_{i}}(t)=1-{t^{2} \over 2}+o(t^{2}),\quad t\rightarrow 0.}

Ta có:

Z n = X ¯ n − μ σ / n = ∑ i = 1 n Y i n . {\displaystyle Z_{n}={\frac {{\overline {X}}_{n}-\mu }{\sigma /{\sqrt {n}}}}=\sum _{i=1}^{n}{Y_{i} \over {\sqrt {n}}}.}

Từ các tính chất cơ bản của hàm đặc trưng, ta suy ra hàm đặc trưng của Zn là

φ Z n ( t ) = [ φ Y i ( t n ) ] n = [ 1 − t 2 2 n + o ( t 2 n ) ] n → e − t 2 / 2 {\displaystyle \varphi _{Z_{n}}\left(t\right)=\left[\varphi _{Y_{i}}\left({t \over {\sqrt {n}}}\right)\right]^{n}=\left[1-{t^{2} \over 2n}+o\left({t^{2} \over n}\right)\right]^{n}\,\rightarrow \,e^{-t^{2}/2}} khi n → + ∞ . {\displaystyle n\to +\infty .}

Giới hạn này là hàm đặc trưng của phân phối chuẩn N(0,1). Từ đó định lý giới hạn trung tâm được chứng minh nhờ vào định lý về tính liên tục của Levy, trong đó có nói rằng, sự hội tụ của các hàm đặc trưng cho phép suy ra sự hội tụ theo phân phối.

Nếu mômen bậc 3 E[(X - μ)3] tồn tại và hữu hạn, thì ta có hội tụ đều (uniform), và vận tốc hội tụ có bậc ít nhất là 1/n½ (xem định lý Berry-Esseen).

Trong các ứng dụng thực tế, định lý này cho phép thay thế tổng vô cùng lớn nhưng hữu hạn các biến ngẫu nhiên bằng một biến ngẫu nhiên có phân phối chuẩn, như vầy sẽ dễ dàng thao tác, tính toán hơn.

Các suy rộng từ định lý

Hàm phân phối xác suất

Hàm phân phối xác suất của tổng nhiều biến ngẫu nhiên độc lập được xác định bởi hàm xoắn (convolution) từ các hàm phân phối xác suất của các biến ngẫu nhiên đó. Từ định lý giới hạn trung tâm, ta có thể suy ra, hàm xoắn này hội tụ về một hàm phân phối xác suất chuẩn khi số biến ngẫu nhiên tăng vô hạn.

Tích các biến ngẫu nhiên

Định lý giới hạn trung tâm phát biểu cho tổng các biến ngẫu nhiên độc lập, câu hỏi là chuyện gì xảy ra với tích của các biến ngẫu nhiên độc lập?

Ta biết rằng, lôgarit (log) của tích các số hạng thì bằng tổng lôgarit các số hạng. Định lý giới hạn trung tâm cho biết tổng lôgarit, và do đó lôgarit của tích, hội tụ về biến ngẫu nhiên phân phối chuẩn. Từ đó suy ra tích các biến ngẫu nhiên hội tụ về một biến ngẫu nhiên có phân phối chuẩn-lôgarit (log-normal).

Liên quan